智能论文笔记

Mining User-aware Multi-Relations for Fake News Detection in Large Scale Online Social Networks

Xing Su , Jian Yang , Jia Wu , Yuchen Zhang

分类：人工智能

2022-12-21

Users' involvement in creating and propagating news is a vital aspect of fake news detection in online social networks. Intuitively, credible users are more likely to share trustworthy news, while untrusted users have a higher probability of spreading untrustworthy news. In this paper, we construct a dual-layer graph (i.e., the news layer and the user layer) to extract multiple relations of news and users in social networks to derive rich information for detecting fake news. Based on the dual-layer graph, we propose a fake news detection model named Us-DeFake. It learns the propagation features of news in the news layer and the interaction features of users in the user layer. Through the inter-layer in the graph, Us-DeFake fuses the user signals that contain credibility information into the news features, to provide distinctive user-aware embeddings of news for fake news detection. The training process conducts on multiple dual-layer subgraphs obtained by a graph sampler to scale Us-DeFake in large scale social networks. Extensive experiments on real-world datasets illustrate the superiority of Us-DeFake which outperforms all baselines, and the users' credibility signals learned by interaction relation can notably improve the performance of our model.

translated by 谷歌翻译

Learning Disentangled Label Representations for Multi-label Classification

Jian Jia , Fei He , Naiyu Gao , Xiaotang Chen , Kaiqi Huang

分类：计算机视觉

2022-12-02

Although various methods have been proposed for multi-label classification, most approaches still follow the feature learning mechanism of the single-label (multi-class) classification, namely, learning a shared image feature to classify multiple labels. However, we find this One-shared-Feature-for-Multiple-Labels (OFML) mechanism is not conducive to learning discriminative label features and makes the model non-robustness. For the first time, we mathematically prove that the inferiority of the OFML mechanism is that the optimal learned image feature cannot maintain high similarities with multiple classifiers simultaneously in the context of minimizing cross-entropy loss. To address the limitations of the OFML mechanism, we introduce the One-specific-Feature-for-One-Label (OFOL) mechanism and propose a novel disentangled label feature learning (DLFL) framework to learn a disentangled representation for each label. The specificity of the framework lies in a feature disentangle module, which contains learnable semantic queries and a Semantic Spatial Cross-Attention (SSCA) module. Specifically, learnable semantic queries maintain semantic consistency between different images of the same label. The SSCA module localizes the label-related spatial regions and aggregates located region features into the corresponding label feature to achieve feature disentanglement. We achieve state-of-the-art performance on eight datasets of three tasks, \ie, multi-label classification, pedestrian attribute recognition, and continual multi-label learning.

translated by 谷歌翻译

AIM 2022 Challenge on Super-Resolution of Compressed Image and Video: Dataset, Methods and Results

Ren Yang , Radu Timofte , Xin Li , Qi Zhang , Lin Zhang , Fanglong Liu , Dongliang He , Fu li , He Zheng , Weihang Yuan

分类：计算机视觉

2022-08-23

本文回顾了AIM 2022上压缩图像和视频超级分辨率的挑战。这项挑战包括两条曲目。轨道1的目标是压缩图像的超分辨率，轨迹〜2靶向压缩视频的超分辨率。在轨道1中，我们使用流行的数据集DIV2K作为培训，验证和测试集。在轨道2中，我们提出了LDV 3.0数据集，其中包含365个视频，包括LDV 2.0数据集（335个视频）和30个其他视频。在这一挑战中，有12支球队和2支球队分别提交了赛道1和赛道2的最终结果。所提出的方法和解决方案衡量了压缩图像和视频上超分辨率的最先进。提出的LDV 3.0数据集可在https://github.com/renyang-home/ldv_dataset上找到。此挑战的首页是在https://github.com/renyang-home/aim22_compresssr。

translated by 谷歌翻译

Improving COVID-19 CT Classification of CNNs by Learning Parameter-Efficient Representation

Yujia Xu , Hak-Keung Lam , Guangyu Jia , Jian Jiang , Junkai Liao , Xinqi Bao

分类：计算机视觉

2022-08-09

Covid-19-Pandemic继续在世界上迅速传播，并在全球人类健康和经济中造成巨大危机。它的早期检测和诊断对于控制进一步的扩散至关重要。已经提出了许多基于学习的深度方法，以帮助临床医生根据计算机断层扫描成像进行自动COVID-19诊断。但是，仍然存在挑战，包括现有数据集中的数据多样性，以及由于深度学习模型的准确性和敏感性不足而导致的检测不满意。为了增强数据多样性，我们设计了增量级别的增强技术，并将其应用于最大的开放式基准测试数据集Covidx CT-2A。同时，在本研究中提出了从对比度学习中得出的相似性正则化（SR），以使CNN能够学习更多参数有效的表示，从而提高了CNN的准确性和敏感性。七个常用CNN的结果表明，通过应用设计的增强和SR技术，可以稳定地提高CNN性能。特别是，具有SR的Densenet121在三个试验中的三类分类中达到99.44％的平均测试准确性，包括正常，非covid-19-19-19肺炎和Covid-19-19。 COVID-19肺炎类别的精确度，敏感性和特异性分别为98.40％，99.59％和99.50％。这些统计数据表明，我们的方法已经超过了COVIDX CT-2A数据集上现有的最新方法。

translated by 谷歌翻译

QueryProp: Object Query Propagation for High-Performance Video Object Detection

Fei He , Naiyu Gao , Jian Jia , Xin Zhao , Kaiqi Huang

分类：计算机视觉

2022-07-22

视频对象检测一直是计算机视觉中一个重要但充满挑战的话题。传统方法主要集中于设计图像级或框级特征传播策略以利用时间信息。本文认为，通过更有效，更有效的功能传播框架，视频对象探测器可以在准确性和速度方面提高。为此，本文研究了对象级特征传播，并提出了一个针对高性能视频对象检测的对象查询传播（QueryProp）框架。所提出的查询Prop包含两个传播策略：1）查询传播是从稀疏的钥匙帧到密集的非钥匙框架执行的，以减少非钥匙帧的冗余计算； 2）查询传播是从以前的关键帧到当前关键框架进行的，以通过时间上下文建模来改善特征表示。为了进一步促进查询传播，自适应传播门旨在实现灵活的钥匙框架选择。我们在Imagenet VID数据集上进行了广泛的实验。 QueryProp通过最先进的方法实现了可比的精度，并实现了不错的精度/速度权衡。代码可在https://github.com/hf1995/queryprop上获得。

translated by 谷歌翻译

Watermark Vaccine: Adversarial Attacks to Prevent Watermark Removal

Xinwei Liu , Jian Liu , Yang Bai , Jindong Gu , Tao Chen , Xiaojun Jia , Xiaochun Cao

分类：计算机视觉

2022-07-17

作为一种常见的安全工具，已广泛应用可见的水印来保护数字图像的版权。但是，最近的作品表明，可见的水印可以通过DNN删除而不会损坏其宿主图像。这样的水印驱动技术对图像的所有权构成了巨大威胁。受到DNN在对抗扰动方面的脆弱性的启发，我们提出了一种新颖的防御机制，可以永久地通过对抗机器学习。从对手的角度来看，可以将盲水水印网络作为我们的目标模型提出。然后，我们实际上优化了对宿主图像上不可察觉的对抗扰动，以主动攻击水印网络，称为水印疫苗。具体而言，提出了两种类型的疫苗。破坏水印疫苗（DWV）在通过水印拆除网络后，诱导了与水印一起破坏宿主图像。相比之下，不可行的水印疫苗（IWV）以另一种方式试图保持水印不清除且仍然明显。广泛的实验证明了我们的DWV/IWV在防止水印去除方面的有效性，尤其是在各种水印去除网络上。

translated by 谷歌翻译

Scaling up Kernels in 3D CNNs

Yukang Chen , Jianhui Liu , Xiaojuan Qi , Xiangyu Zhang , Jian Sun , Jiaya Jia

分类：计算机视觉 | 机器学习

2022-06-21

2D CNN和视觉变压器（VIT）的最新进展表明，大型内核对于足够的接受场和高性能至关重要。受这些文献的启发，我们研究了3D大型设计的可行性和挑战。我们证明，在3D CNN中应用大型卷积内核在性能和效率方面都有更多困难。在2D CNN中运行良好的现有技术在3D网络中无效，包括流行的深度卷积。为了克服这些障碍，我们介绍了空间团体卷积及其大内核模块（SW-LK块）。它避免了幼稚3D大核的优化和效率问题。我们的大型内核3D CNN网络，即grounkernel3d，对各种3D任务（包括语义分割和对象检测）产生了非平凡的改进。值得注意的是，它在ScannETV2语义细分和72.8％的NDS NUSCENES对象检测基准上获得了73.9％的MIOU，在Nuscenes Lidar Leadar排行榜上排名第一。具有简单的多模式融合，将其进一步提高到74.2％NDS。与其CNN和Transformer对应物相比，bamekernel3d获得了可比或优越的结果。我们第一次表明，大型内核是可行的，对于3D网络至关重要。

translated by 谷歌翻译

Hierarchical Similarity Learning for Aliasing Suppression Image Super-Resolution

Yuqing Liu , Qi Jia , Jian Zhang , Xin Fan , Shanshe Wang , Siwei Ma , Wen Gao

分类：计算机视觉

2022-06-07

作为一个严重的问题，近年来已经广泛研究了单图超分辨率（SISR）。 SISR的主要任务是恢复由退化程序引起的信息损失。根据Nyquist抽样理论，降解会导致混叠效应，并使低分辨率（LR）图像的正确纹理很难恢复。实际上，自然图像中相邻斑块之间存在相关性和自相似性。本文考虑了自相似性，并提出了一个分层图像超分辨率网络（HSRNET）来抑制混叠的影响。我们从优化的角度考虑SISR问题，并根据半季节分裂（HQS）方法提出了迭代解决方案模式。为了先验探索本地图像的质地，我们设计了一个分层探索块（HEB）并进行性增加了接受场。此外，设计多级空间注意力（MSA）是为了获得相邻特征的关系并增强了高频信息，这是视觉体验的关键作用。实验结果表明，与其他作品相比，HSRNET实现了更好的定量和视觉性能，并更有效地释放了别名。

translated by 谷歌翻译

PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images

Yingfei Liu , Junjie Yan , Fan Jia , Shuailin Li , Qi Gao , Tiancai Wang , Xiangyu Zhang , Jian Sun

分类：计算机视觉

2022-06-02

在本文中，我们提出了PETRV2，这是来自多视图图像的3D感知统一框架。基于PETR，PETRV2探讨了时间建模的有效性，该时间建模利用先前帧的时间信息来增强3D对象检测。更具体地说，我们扩展了PETR中的3D位置嵌入（3D PE）进行时间建模。 3D PE可以在不同帧的对象位置上实现时间对齐。进一步引入了特征引导的位置编码器，以提高3D PE的数据适应性。为了支持高质量的BEV分割，PETRV2通过添加一组分割查询提供了简单而有效的解决方案。每个分割查询负责分割BEV映射的一个特定补丁。 PETRV2在3D对象检测和BEV细分方面实现了最先进的性能。在PETR框架上还进行了详细的鲁棒性分析。我们希望PETRV2可以作为3D感知的强大基准。代码可在\ url {https://github.com/megvii-research/petr}中获得。

translated by 谷歌翻译

Knowledge-aware Document Summarization: A Survey of Knowledge, Embedding Methods and Architectures

Yutong Qu , Wei Emma Zhang , Jian Yang , Lingfei Wu , Jia Wu

分类：自然语言处理 | 人工智能 | 机器学习

2022-04-24

在过去的几十年中，知识感知的方法增强了一系列自然语言处理应用。随着收集的动力，最近在文档摘要中引起了知识，这是自然语言处理应用之一。先前的作品报告说，知识包裹的文档摘要在产生卓越的消化方面表现出色，尤其是在信息性，连贯性和事实一致性方面。本文追求对将知识嵌入文档摘要的最先进方法论进行的首次系统调查。特别是，我们提出了新的分类法，以概括文档摘要观点下的知识和知识嵌入。我们进一步探讨了如何在嵌入文档摘要模型的学习体系结构时，尤其是深度学习模型的学习架构。最后，我们讨论了这个主题和未来方向的挑战。

translated by 谷歌翻译